package eitwitter.normalization;

import java.util.HashMap;

/**
 * Tokenizer qui decoupe le texte uniquement suivant les espaces
 * @author AH & PJ
 */
public class SpacesTokenizer implements Normalizer{

	@Override
	public HashMap<String, Integer> normalize(String text) {
		HashMap<String, Integer> tokens = new HashMap<String, Integer>();
		String[] words = text.split(" ");
		
		// Parcours de tous les mots trouves
		for(String word : words){
			if(tokens.containsKey(word)){
				
				// Si le mot est deja enregistre, incrementer
				tokens.put(word, tokens.get(word) + 1);
			} else {
				// Sinon, ajouter
				tokens.put(word, 1);
			}
		}
		return tokens;
	}
}
